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PROCEDES ET DISPOSITIFS D'EVALU ATION DE DELAIS DE TRANSMISSION ET DE 
TRATTEMENT D'UN SIGNAL DE PAROLE RECU DANS UN TERMINAL REUE A UN RESEAU 

DE PAQUETS 

5 DESCRIPTION 

La presente invention a trait de maniere generate aux reseaux a 
commutation de paquets, notamment IMntemet, et plus particulierement a la 
telephonie sur reseau IP. 

10 L'invention concerne plus precisement un procede d'evaluation du delai 

de traitement d'un signal de parole contenu dans des paquets de donnees 
recus dans un terminal recepteur equipe d'un module de tel6phonie, au cours 
d'une communication vocale etablie au travers d'un reseau a commutation de 
paquets avec un terminal emetteur des paquets de donnees. L'invention 

15 concerne encore un procede d'evaluation du delai de transmission de bout en 
bout d'un signal de parole recu dans un terminal recepteur, ce delai de bout en 
bout incluant le delai precrte de traitement du signal de parole. L'invention 
concerne aussi des dispositifs aptes a mettre en ceuvre les precedes precites. 
Les possibilites accrues de joindre et de communiquer avec n'importe 

20 quel interlocuteur en un lieu sensiblement quelconque du globe terrestre, a un 
instant quelconque et pour un coQt derisoire, celui d'une communication locale, 
par I'intermediaire du reseau ^interconnexion mondial de I'lnternet, ont suscite 
un engouement pour la telephonie sur reseau a commutation de paquets, plus 
particulierement pour la telephonie sur IP (Internet Protocol). 

25 Contrairement a la telephonie classique sur reseau fixe par 

I'intermediaire du reseau telephonique commute, la communication en 
telephonie sur reseau a commutation de paquets, en particulier la telephonie 
sur IP, presente le plus souvent une qualite mediocre en I'absence de garantie 
d'un niveau de qualite minimum. 

30 Cette absence de garantie de qualite vocale en telephonie sur IP est 

inherent a la conception meme du reseau, lequel favorise I'interconnexion des 
interlocuteurs au detriment de la bande passante fmalement allouee au signal 
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de parole, seul un critere de meilleur effort (best effort) en mattere de bande 
passante allou6e 6tant admissible. En particulier, le d6bit des informations 
transmises, sous forme de paquets num6riques repr6sentatifs du signal de 
parole, diminue au fur et d mesure que les usagers du r6seau IP se connectent 
5 et utilisent le r6seau, en t6l6phonie sur IP ou non. 

Le d6ploiement dans des conditions satisfaisantes des services de 
t6l6phonie sur IP n6cessite done la mise en ceuvre d'un contr6le de la quality 
des services proposes et en particulier la mise en ceuvre d'outils de mesure de 
cette quality. 

10 Pour rappel, les principaux d6fauts d'une transmission en tel6phonie sur 

IP, encore d§sign6e par "voix sur IP M (voice over IP - VoIP), sont les suivants : 

* Les retards importants, Ii6s aux d6Iais d'acheminement et aux temps de 
traitement par les 6quipements du r6seau. Ce d6faut peut gSner I'interactivite et 
done rendre la conversation entre appelant et appel6 difficile, voire impossible. 

15 - La gigue (jitter en anglais) dans la dur£e d'acheminement des paquets, 

c'est-&-dire la variance statistique du d6Iai de transmission. Ce ph£nomdne se 
traduit par des intervalles de temps de longueur variable entre les instants 
d'arriv6e des paquets. 

- Les pertes de paquets, provoqu6es soit parce que ces paquets ont £t£ 
20 6limin6s lors de I'acheminement, leur dur6e de vie 6tant 6puis6e, suite £ 

I'encombrement des routeurs, soit parce quits sont arrives au terminal distant 
avec un retard trop important, ces paquets £tant alors d6truits & l ( arriv§e. 

- L'6cho Ii6 principalement aux retards 6lev6s et extr§mement variables. 

- La distorsion due au codage du signal de parole en paquets 
25 num6riques & d6bit r6duit, g6n6ralement utilise en VoIP. 

Le d6lai (ou temps) de transmission de bout en bout du signal de parole 
repr6sente le cumul de ('ensemble des retards g6n£r£s dans la chatne de 
transmission et de traitement du signal de parole. A ce titre, il constitue le d6lai 
rSellement per$u par i'usager, il est d'ailleurs parfois d6sign6 par "d6lai de 
30 bouche & oreille". 

Le d§lai de transmission de bout en bout est ainsi compost du delai de 
transmission sur le r6seau de paquets (IP, ATM - Asynchronous Transfert 
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Mode), et du temps de traitement et de transmission dans les 6quipements de 
terminaison IP (telephone IP, passerelle, r6seau local). 

Le d6Iai de transmission sur le r6seau en mode paquets prend en 
compte le temps de traitement au niveau des gquipements et en particulier au 

5 niveau des routeurs. Ce temps de traitement ddpend notamment du nbmbre 
d'gquipements traverses, des fonctions impI6ment§es sur ces 6quipements 
(proxy, transcodage, pare-feu, etc.), de la bande passante disponible. 

D'autre part, le temps de traitement dans les 6quipements et r6seaux de 
terminaison prend en compte les retards Introduits par le codec 

10 (codeur/d6codeur) audio, la memoirs tampon (buffer) de gigue, la mise en 
paquets, la detection d'activite vocale, etc., ainsi qu'une eventueile transmission 
sur un r§seau de transmission ou d'acces en mode circuit. Le temps de 
traitement dans les equipements et r6seaux de terminaison peut dtre 
decompose en une partie Emission et une partie reception. 

15 La mesure du deiai de transmission de bout en bout peut etre done trfcs 

utile dans le cadre de revaluation de la qualite des communications vocales sur 
le r6seau de paquets. En effet, la mesure de deiai de transmission peut etre 
corr6l6e avec le niveau de quality pergue par Pusager. Par consequent, si Ton 
connaTt les valeurs limites en termes de quality pergue, du deiai de 

20 transmission de bout en bout, on pourra agir au niveau de I'ing&nierie du reseau 
ou sur la configuration des equipements d'extremite pour garder ce temps de 
transmission dans des limites acceptables. 

La mesure du temps de transmission de bout en bout d'un signal de 
parole est typiquement r6alis6e de fagon intrusive, e'est-a-dire, & Paide de deux 

25 sondes simulant ou se substituant aux terminaux d'extremite, et etablissant 
entre elles des communications de test. 

Selon ce principe, la mesure du temps de transmission proprement dit 
s'effectue alors par une comparison entre le signal 6mis par la sonde 
emettrice et le signal regu par la sonde r6ceptrice. Ceci necessite 

30 imp6rativement que Penregistrement des deux signaux soit effectue avec la 
m§me base temporelle, et partant que les deux sondes soient synchronises. 
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Les signaux de tests utilises pour ces mesures peuvent dtre de signaux 
de parole, des signaux composites ou encore de simples frequences. 

Des sondes du commerce mettant en oeuvre un tel principe de mesure. 
intrusive, sont par exemple celles qui utiiisent le module psycho-acoustique 
5 connu sous I'acronyme PESQ (Perceptual Evaluation of Speech Quality) et 
normalise dans la recommandation P.862 de PUIT-T (Union Internationale des 
Telecommunications). 

revaluation du temps de transmission de bout en bout par des sondes 
intrusives pr6sente deux types d'inconv6nients. D'une part, les mesures 
10 r6alis6es ne portent pas sur des communications reelles entre usagers, et 
d'autre part, elles ne prennent pas en compte le traitement du signal de parole 
effectue dans les terminaux reels des usagers. Par consequent, ce type 
devaluation peut etre utilise pour caracteriser la qualite d'un service de 
teiephonie d'une maniere gen6rale et non pour caracteriser la qualite vocale 
15 des communications reelles entre deux usagers. 

Ainsi, compte tenu du developpement croissant de la teiephonie sur IP, 
il y a un reel besoin de disposer d'outils permettant d'6valuer la qualite vocale 
effectivement pergue par I'utilisateur d'un terminal de teiephonie de type "voix 
sur IP M , au cours de communications teiephoniques reelles. Correiativement, il y 
20 a egalement un besoin d'outils permettant d'6valuer de maniere non-intrusive le 
deiai reel de traitement d'un signal de parole regu dans un terminal, et 
consecutivement le deiai de transmission de bout en bout d'un signal de parole 
au cours de communications reelles entre deux equipements de terminaison IP, 
tels que des telephones IP (IPphone) ou des PCs equip6s de logiciels de 
25 teiephonie IP (softphone). 

La presente invention a pour objectif de repondre & ce besoin. A cet 
effet, Tinvention concerne, selon un premier aspect, un procede devaluation du 
deiai de traitement d'un signal de parole contenu dans des paquets de donn6es 
regus dans un terminal recepteur 6quip6 d'un module de teiephonie, au cours 
30 d'une communication vocale etablie au travers d'un reseau £ commutation de 
paquets avec un terminal emetteur des paquets de donnees. Ce procede est 
remarquable en ce qu'il comporte les etapes suivantes : 
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- obtention, d partir des paquets de donn6es regus, d'un flux de paquets 
audio contenant le signal de parole ; 

- d6codage, selon un temps de d6codage predetermine, du flux de 
paquets audio obtenu et creation d'un premier signal de parole reconstitue ; 

5 - duplication d'au moins une partie du signal de parole reconstitue par le 

module de t6l6phonie, cette partie du signal de parole reconstitue constituant 
. un second signal de parole ; 

- determination du decalage temporel existant entre les premier et 
second signaux de parole ; 

10 - calcul du deiai "D3" de traitement du signal de parole dans le terminal 

recepteur, d partir d'au moins le decalage temporel mesure entre les premier et 
second signaux de parole, et le temps de decodage predetermine. 

GrSce £ ce proc6d6, on dispose d'un outil permettant d'6valuer de 
maniere non-intrusive, c'est-a-dire au cours de communications reelles, le deiai 

15 de traitement d'un signal de parole dans un terminal recepteur relie d un r6seau 
de paquets. Cet outil pourra done permettre de contribuer d evaluer la qualite 
vocale reellement pergue par un utilisateur d'un terminal de teiephonie. 

Selon une caracteristique particuliere de ('invention, le d6calage temporel 
existant entre le premier et le second signal de parole est mesure selon une 

20 methode utilisant une fonction d'intercorreiation des signaux d'enveloppe 
desdits premier et second signaux. 

Selon un second aspect, ('invention concerne un procede devaluation du 
deiai de transmission de bout en bout d'un signal de parole regu dans un 
terminal recepteur, au cours d'une communication vocale etablie au travers d'un 

25 reseau £ commutation de paquets avec un terminal 6metteur du signal de 
parole. Ce procede est remarquable en ce qu'il comporte une etape 
d'evaluation du deiai de traitement du signal de parole dans le terminal 
recepteur, selon un proc6d6 d'evaluation tel que brievement expose plus haut. 
Selon une caracteristique particuliere de Pinvention, ce procede 

30 devaluation du deiai de transmission d'un signal de parole, comprend en outre 
les etapes suivantes : 

- evaluation du deiai "D1" de traitement & remission du signal de parole ; 
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- mesure du d6lai "D2" de transmission du signal de parole dans le 
rgseau ; 

- Evaluation du d6lai de transmission de bout en bout d partir du d6lai 
"D1" de traitement d Emission, du d6lai "D2" de transmission, et du ddlal "D3" 

5 de traitement a la reception. 

Un tel proc6d6 devaluation du deiai de transmission de bout en bout, en 
particulier parce qu'il est non intrusif, est un outil efficace devaluation de la 
quality vocale perpue par Tutilisateur d'un terminal de teiephonie au cours de 
communications r6elles. 

10 Corr6lativement, invention conceme un dispositif d installer dans un 

terminal de communication vocale sur r6seau de paquets, comportant des 
moyens pour mettre en oeuvre le ou les precedes selon Tinvention tels 
qu'expos6s succinctement supra. 

Selon un mode de realisation pr6ter6 de Pinvention, un tel dispositif est 

15 implements sous la forme de modules programmes executes sur un systeme 
informatique constituant ou incorpor6 dans un 6quipement terminal de 
communication vocale sur r6seau de paquets. Par consequent, la presente 
invention vise aussi un programme d'ordinateur, eventuellement stocke sur un 
support d'informations, ce programme etant apte £ mettre en oeuvre le ou les 

20 precedes pr6cit6s lorsqu'il est charge puis execute sur un systeme 
informatique. 

Les avantages de ce dispositif et de ce programme d'ordinateur sont 
identiques d ceux des precedes conformes d invention, tels que succinctement 
exposes supra. 

25 D'autres particularites et avantages de Tinvention apparaTtront encore & 

la lecture de la description ci-apr&s de I'invention, faite d I'appui des dessins 
annexes, sur lesquels : 

- la figure 1 represente schematiquement un exemple de r6seau a 
commutation de paquets auquel peut s'appliquer la pr6sente invention ; 

30 - la figure 2 est un diagramme schematique d'un terminal de teiephonie 

IP comprenant, conform6ment & ('invention, des moyens pour evaluer le deiai 
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de traitement d'un signal de parole regu dans le terminal, et des moyens pour 
6valuer le d6lai de transmission de bout en bout du signal de parole ; et 

- la figure 3 est un organigramme illustrant un proc6d6 devaluation du 
deial de transmission de bout en bout d'un signal de parole, selon I'invention. 
5 La figure 1 repr6sente un r6seau d commutation de paquets 2 

fonctionnant selon une pile de protocoles bas6e sur le protocole IP (Internet 
Protocol), couramment d6sign6 par "r6seau IP", ^invention s'applique 
cependant d tout r6seau de commutation de paquets base sur un protocole de 
type IP. 

10 Au r6seau 2 sont relies des Squipements d'extr6mit6 IP : 1, 3, 4, parmi 

lesquels, certains sont aptes & etablir des communications vocales sur IP 
(VoIP) et sont commun6ment d6sign6s par "terminaux IP", tels que des 
telephones IP 3, ou des ordinateurs personnels multimedias (PC) 1 6quip6s 
d'un logiciel de teiephonie adapts, tandis que d'autres Squipements, comme le 

15 serveur 4 sont destines & foumir sur le f6seau des services particuliers. 

De maniere £ simplifier I'expose de I'invention, on a represents d la figure 
1 un seul r&seau (2), cependant le r6seau 2 peut englober un certain nombre 
de sous-r6seaux assoctes £ des equipements de type passerelle et/ou routeurs 
permettant d'interconnecter ces sous-r6seaux et de rendre possible ainsi une 

20 communication IP de bout en bout entre les terminaux IP. 

Parmi ces sous-r6seaux, on peut trouver typiquement un reseau 
commute (RTC), ainsi que des r6seaux locaux (par ex. Ethernet). 

Selon un mode de realisation prefers, les terminaux ip 1, 3 
communiquent entre eux en utilisant Fensemble des protocoles de 

25 communication dSfinis selon la recommandation H.323 de I'UIT-T (Union 
Internationale des Telecommunications). Pour obtenir plus d'informations sur 
cet ensemble de protocoles, on pourra consulter le site Web suivant : 
www.itu.org. 

Selon un autre mode de realisation, les terminaux IP 1, 3 communiquent 
30 entre eux en utilisant ('architecture de protocoles SIP (Session Initiation 
Protocol) propos6e par I'lETF (Internet Engineering Task Force). On pourra 



WO 2005/015889 



8 



PCT/FR2004/0016J6 



obtenir plus d'informations sur cette architecture en consultant le site Web : 
www.ietf.org. 

Bien entendu, I'invention n'est nullement limine d ces deux families de 
protocoles, mais s'applique au contraire d toute architecture protocolaire 
5 supportant la voix sur IP. 

Le serveur 4 est ici un serveur de collecte charg6 de r6cup6rer, comme 
. expose plus bas dans la description, des informations de quality relatives aux 
communications vocales stabiles dans les terminaux IP (1, 3). En particulier, 
ces informations incluent des valeurs de deiais de transmission de bout en bout 
10 obtenues conform§ment d I'invention. 

Chaque terminal IP 1, 3, est 6quip6 d cet effet d'un dispositif selon 
(Invention permettant d'Svaluer le d6lai de transmission de bout en bout d'un 
signal de parole reconstitu6 dans le terminal d partir des paquets de donn£es IP 
re$us au cours d'une communication. 
15 La figure 2 repr6sente sch6matiquement un terminal de teiephonie IP 

comprenant conform6ment & 1'invention, des moyens pour dvaluer le deiai de 
traitement d'un signal de parole regu dans le terminal, et des moyens pour 
^valuer le d6lai de transmission de bout en bout du signal de parole. 

Ces moyens constituant un dispositif selon I'invention sont incorpor6s 
20 dans un terminal de tel§phonie sur IP. Dans cet exemple d'imptementation, le 
terminal IP consid6r6 est un ordinateur personnel (PC, 1) de type multimedia 
6quip6 d'une application de t6!6phonie. 

Le terminal 1 6quip6 conform6ment d I'invention, comporte un ensemble 
de modules 101-135 essentiellement de nature logicielle. Parmi ces modules, 
25 un certain nombre est incorpor6 de manfere classique dans le terminal, il s'agit 
des modules suivants : 

- une interface r6seau 101 ; 

- un gestionnaire de protocoles 103, designee aussi par "pile 
protocolaire" ; 

30 - une application de tel6phonie 107 ; 

- un m6langeur audio 109 ; 

- un pilote de carte son 113; 



WO 2005/015889 



9 



PCT/FR2004/001636 



-une carte son 115 ; 

- au moins un haut-parleur 117 ; 

- une interface de programmation A de type API (Application 
Programming Interface). 

s Les autres modules, sp6cifiques d la pr6sente invention, sont les 

suivants : 

- un module 105 de filtrage r£seau ; . . 

- un module 1 1 1 de filtrage audio ; 

- un module de d6codage audio "t£moin" 123 ; 
10 - des moyens de memorisation 129 ; 

- un module 119 devaluation de d6lai de traitement d remission (D1) du 
signal de parole re$u dans le terminal 1 ; 

- un module 121 devaluation de d6lai de transmission r6seau (D2) d'un 
signal de parole regu dans le terminal 1 ; 

15 - un module 131 devaluation de d6lai de traitement a la reception (D3) 

du signal de parole ; 

- un module 133 devaluation du d6lai de transmission de bout en bout d 
partir des d£lais D1, D2, et D3 pr6cit6s ; et 

- un module 135 de g6n6ration et de transmission ^informations de d6lai 
20 & un serveur de collecte sur le r6seau. 

^interface r6seau 101 inclut traditionnellement une carte r£seau et les 
6l6ments n6cessaires pour permettre au terminal 1 consid6r6 de se connecter 
au r£seau 2 et de recevoir les signaux glectriques acheminant les informations 
cod6es. Ces 6l§ments incluent en particulier un modem 
25 (modulateur/d6modulateur). 

Uinterface r6seau d^livre en sortie un flux de paquets IP contenant 
notamment des trames de voix num6ris6e. 

Les paquets IP sont ensuite pris en charge par le gestionnaire de 
protocoles 103. lis subissent alors un traitement de d6sencapsulation 
30 protocolaire selon Pensemble de protocoles de communication (pile de 
protocoles) utilise au-dessus du protocole IP. 
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Typiquement, ce processus de d6sencapsulation protocolaire permet 
d'obtenir : 

- des messages de signalisation d'appel, 

- des messages de negotiation d'appel, 

5 - un flux de paquets de donnees audio, et 

- un flux de paquets de donnees de contrflle de communication. 

Dans un mode de realisation pr6f6r6 dans lequel on utilise I'ensemble de 
protocoles H.323, les messages de signalisation d'appel sont des messages 
selon le protocole de signalisation d'appel H.225.0, les messages de 

10 negotiation d'appel sont des messages selon le protocole de negotiation 
H.245, le flux de paquets audio est constitue d'un flux de paquets selon le 
protocole RTP (Real Time Protocol) contenant des frames de signal audio 
numerise, et le flux de paquets de donnees de contrdle de communication est 
constitue d'un flux de paquets selon le protocole de contrdle RTCP (Real Time 

15 Control Protocol). Les deux protocoles, RTP et RTCP, sont eux-mSmes places 
au dessus du protocole UDP (User Datagram Protocol). 

Dans un autre mode pr6f6r6 de realisation dans lequel on utilise 
I'ensemble de protocoles de ('architecture SIP (Session Initiation Protocol), les 
messages de signalisation d'appel et les messages de negotiation d'appel sont 

20 contenus dans des messages selon le protocole SIP, le flux de paquets audio 
est constitue d'un flux de paquets selon le protocole RTP contenant des frames 
de signal audio numerise, et le flux de paquets de donnees de contrdle de 
communication est constitue d'un flux de paquets selon le protocole RTCP. 

Selon une implementation particuliere, le systeme d'exploitation du PC 

25 (1) est Windows™ commercialise par la societe Microsoft, et le gestionnaire de 
protocoles 103 est constitue de la bibliotheque de fonctions Winsock. 
L'ensemble de fonctions standardis6es fournies par la bibliotheque Winsock 
permet ainsi de faire tourner sous Windows des applications qui fonctionnent 
avec les protocoles TCP/UDP-IP, independamment du materiel utilise. 

30 En sortie de la pile protocolaire 103, les diff6rents flux de messages et de 

paquets de donnees, c'est-^-dire, les messages de signalisation d'appel, les 
messages de negotiation d'appel, le flux de paquets de donnees audio, et !e 
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flux de paquets de donnees de contrdle de communication, sont delivres au 
module de filtrage reseau 105 (decrit plus bas). 

L'interface de type API (referencee par A a la figure 2), est fournie par le 
systeme d'exploitation du terminal 1, et permet aux applications informatiques 
5 concues pour acceder au reseau, d'y acceder via le gestionnaire de protocoles 
103, en utilisant une bibliotheque de fonctions ou primitives standardises. Ces 
primitives permettent ainsi aux applications d'acceder aux protocoles de 
communication implantes dans le terminal, et de recevoir et envoyer des 
donndes. 

10 Comme mentionne plus haut, en prenant le cas d'une implementation 

selon les protocoles H.323, on obtient en sortie du gestionnaire de protocoles 
1 03 les flux de donnees suivants : 

- un flux de messages de signalisation d'appel selon le protocole 
H.225.0 ; 

15 - un flux de messages de negotiation d'appel selon le protocole de 

negotiation H.245 ; 

- un flux de paquets de donnees selon le protocole UDP, les paquets 
UDP incluant des paquets de donnees audio selon le protocole RTP et des 
paquets de donnees de contrdle de communication selon le protocole RTCP. 

20 Ces flux d'informations sont typiquement delivr§s en entree a 

I'application de telephonie 107. Dans le cadre du mode de realisation decrit ici, 
I'application de telephonie utilisee est le logiciel NetMeeting™ commercialise 
par la societe Microsoft. 

Conformement a la presente invention, le dispositif selon I'invention 
25 comporte un module 105 de filtrage reseau, intercale entre le module de 
gestion protocolaire 103 et le module de telephonie 107. 

Le module 105 est transparent vis-a-vis des flux de donnees sortant du 
gestionnaire de protocoles (il ne les modifie pas). II comporte des moyens 
logiciels, c'est-a-dire des fonctions programmees particulieres, pour detecter 
30 I'etablissement d'une communication vocale et identifier la communication. 

A la figure 2, une communication vocale est etablie entre le telephone IP 
3 et le PC 1. En pratique, I'etablissement d'une communication vocale est 
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ddtect* par le filtre r6seau 105, lors de la reception d'un message de 
signalisation d'appel caract6ristique de T6tablissement d'une connexion selon le 
protocols de signalisation d'appel utilisd. 

Conform6ment d Tinvention, le filtre r6seau 105 comprend des moyens 

5 pour obtenir & partir des paquets UDP fournis par la pile protocolaire 103, le flux 
de paquets audio selon le protocole RTP contenant le signal de parole transmis 
par le terminal gmetteur. En pratique, le filtre rgseau extrait du flux de paquets 
UDP, le flux de paquets RTP, le duplique puis le fournit en entr6e au module de 
d6codage temoin 123. 

10 Selon un exemple de realisation, le filtre r6seau 105 est implements sous 

la forme d'une bibliothfeque de liens dynamiques (DLL - data link library). Cette 
DLL est charg6e automatiquement lors de Tappet de interface API de Winsock 
par une application. 

Cette biblioth&que communique avec le gstionnaire de protocoles 

15 Winsock par Tinterm6diaire d'interfaces particulferes, fournies par Winsock : 
interface API et une autre interface connue sous Tacronyme SPI. ^interface 
SPI (Service Provider Interface) permet d'imptementer chacune des differentes 
fonctions composant le filtre r6seau sous la forme d'une LSP (Layered Service 
Provider). 

20 Une instanciation du filtre r6seau est cr66e lorsque le module de 

t6l6phonie (107) demande la creation d'un canal de communication r§seau 
(socket). Plus pr6cis6ment, I'instanciation d'un filtre r6seau est faite lors de 
Tappet des fonctions 'WSPSocket' et 'WSPAccept' de Tinterface API de Winsock 
par Tapplication de t6l6phonie, 

25 Le filtre r§seau selon invention est congu de manure & §tre compatible 

avec une plurality de protocoles de communication. A cet effet, il est con$u 
comme un filtre g§n§rique qui se decline en filtres sp6cifiques (protocolaires). 
Ces filtres specifiques sont adapts & traiter les donn6es transmises selon des 
protocoles differents de mSme niveau ou bien selon les protocoles d'une famille 

30 particultere de protocoles (SIP, H.323). 

Le d£codeur temoin 123 est un d6codeur audio, par exemple de type 
G.711, identique a celui mis en oeuvre dans le module de telephonie 107. De 
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cette facon, le temps de traitement, note "Tdec", du decodeur temoin est le 
meme que celui utilise dans le module de telephonie. Cependant, on peut 
utiliser egalement un decodeur temoin different de celui du module de 
telephonie, a la condition que la difference de duree de traitement entre les 

s deux decodeurs soit constante et connue. 

Le decodeur temoin 123 a pour fonction de decoder, selon un temps de 
decodage predetermine car connu a I'avance, le flux de paquets audio RTP 
fourni par le filtre reseau 105. En sortie du module de decodage temoin, on 
obtient done un signal de parole reconstitue, typiquement sous forme 

10 d'echantillons au format PCM (Pulse Code Modulation). 

Le signal de parole reconstitue est alors sauvegarde sous la forme d'un 
fichier informatique F1 dans la memoirs 129. Cette memoirs peut etre 
constitute, par exemple, par une portion de I'espace memoire d'un disque dur, 
ou bien par une zone particuliere d'une memoire vive (RAM). 

15 De retour a la figure 2, les flux de donnees qui sortent du gestionnaire de 

protocoles 103 (Winsock) sont fournis au travers du filtre reseau 105 qui ne 
modifie pas ces donnees, au module de telephonie (NetMeeting) 107. 

Le module de telephonie 107 inclut de maniere classique, outre le 
decodeur audio 107b, une memoire tampon de gigue 107a, et un bloc 107c de 

20 traitement de signal assurant des traitements tels que par exemple, la 
generation de bruits de contort, I'annulation d'echo, Pajustement de niveaux, 
etc. 

En fonctionnement, le module de telephonie 107 extrait du flux de 
paquets UDP qu'il recoit, les paquets selon le protocole RTP et en extrait les 
25 trames de signal audio numerise et encode. Grace au decodeur audio 107b, le 
signal audio est alors reconstitue, puis sous Taction du bloc de traitement du 
signal 107c, un certain nombre de traitements est effectue sur celui-ci 
(traitement de la gigue, de I'echo, etc.). 

Le module de telephonie delivre en sortie un signal audio reconstitue, 
30 typiquement sous forme d'echantillons au format PCM (Pulse Code 
Modulation). 
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Les 6chantillons de voix cod6e PCM sont alors d6livr6s au m6langeur 
audio 109 qui applique sur le signal de parole des r6glages pr6d6finis en vue de 
sa restitution acoustique, de telle sorte que le signal de parole sortant du 
m6langeur audio est le signal audio final qui sera traduit de fagon sonore, et 
5 done entendu par Putilisateur du terminal 1 . 

On notera ici que le d6lai introduit par le mdlangeur audio est n6gligeable 
vis-a-vis du d6lai de traitement global du signal de parole dans le terminal 
r6cepteur 1. 

Le signal audio reconstitu6 par le module de t6l6phonie 107 est fourni en 
10 entr6e, via le meiangeur audio, au module 111 de ftltrage audio selon 
^invention. Ce dernier pr6l6ve le signal audio reconstitug par le module de 
tel&phonie et Penregistre dans un second fichier informatique F2 stock6 dans la 
m6moire 129. 

Le filtre audio 111 est activ6 de manure synchrone avec le filtre r6seau 

15 105, de telle sorte que les enregistrements du fichier F1 en sortie du d£codeur 
temoin 123, et du fichier F2 en sortie du filtre audio 109, sont effectu6s 
simultan6ment ou £ des instants distincts mais dont I'Scart est parfaitement 
connu, ces instants 6tant determines par une mSme horloge temporelle. 

De m§me que le filtre r6seau, le filtre audio 111 ne modifie pas le signal 

20 audio qu'il regoit, de concert avec le filtre rSseau il pr6l£ve; e'est-a-dire recopie, 
une partie au moins du signal de parole reconstitu£ (flux d'Schantillons PCM), 
juste avant sa deiivrance £ la carte son 115 via le pilote de carte son 113. Le 
signal de parole reconstitu£ est finalement converti par un convertisseur 
num£rique-analogique present dans la carte son, en un signal £lectrique 

25 transforms en ondes acoustiques par le haut-parleur 117. 

En pratique, pour ('implementation du filtre audio 111, on utilise 
Tarchitecture connue sous le nom "Windows Driver Model" (WDM). Cette 
architecture permet de r6aliser un interfagage avec des pilotes de p6riph£rique 
(device driver) appartenant & une mSme classe, representative d'un m§me type 

30 de p£riph6rique. On peut alors filtrer des donn6es & destination d'un 
p6riph6rique particulier de cette classe. En utilisant cette architecture, le filtre 
audio est implements par Installation d'un pilote de peripherique, de classe 
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MEDIA, qui est automatiquement charge lors du d6marrage du systeme 
d'exploitation Windows. 

De retour a la figure 2, conformdment d rinvention, le terminal r6cepteur 
1 comprend un module 131 devaluation du d6lai de traitement du signal de 

5 parole regu. Celui-ci revolt en entree, & partir de la m6moire 129, d'une part le 
signal de parole F1 d6cod6 par le module 123 de d6codage temoin, et d'autre 
part le signal de parole F2 decode par le module 107 de teiephonie. Dans le 
cadre de I'expose de rinvention, le deiai de traitement du signal de parole re$u 
dans le terminal (1) est d6sign6 par "deiai D3". 

10 Selon rinvention, le module 131 devaluation du deiai D3 comprend un 

certain nombre de sous-modules. Le module 131 comprend en effet, un sous- 
module de detection d'activite vocale (DAV), non represents d la figure 2, 
destine £ mesurer le taux d'activite vocale dans chacun des signaux vocaux 
enregistrgs F1 et F2. Les algorithmes de detection d'activite vocale sont bien 

15 connus de letat de la technique. Comme cela sera expose plus bas en relation 
avec la figure 3, la suite du processus devaluation du d6lai de traitement D3, 
sera mis en ceuvre si I'activite vocale detectee dans les premier et second 
signaux de parole F1 et F2, est superieure & un seuil predetermine. 

Le module 131 devaluation du deiai D3, comprend d'autre part un sous- 

20 module (non represents) de determination du decalage temporel existant entre 
les deux signaux de parole F1 et F2. Conform6ment d rinvention, le decalage 
temporel determine entre les signaux F1 et F2, prend en compte la difference 
de dur6e du traitement op6re sur le flux de paquets RTP en sortie du filtre 
r6seau 105, par, d'une part, le module 107 de t6l6phonie, et d'autre part, par le 

25 module 123 de decodage temoin. 

Puisque les temps de traitement du decodeur temoin 123 et du decodeur 
107b sont identiques ou tr6s proches, le decalage temporel mesure represente 
le d6lai cumuie introduit par la m6moire tampon 107a et le bloc 107c de 
traitement de signal, ce deiai etant par nature variable et done difficilement 

30 mesurable de maniere directe. 

Le module 131 comprend enfin un sous-module (non represente) charge 
de calculer le deiai D3 de traitement global du signal de parole regu (sous forme 
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de flux RTP) dans le terminal de communication 1. Comme cela sera expos6 
plus bas en liaison avec la figure 3, le d6lai D3 est 6valu6 en prenant en compte 
la valeur du d6calage temporel mesur6 entre les signaux F1 et F2. 

Le terminal 1 de communication selon invention comprend en outre un 

5 module 121 devaluation du d6lai "D2" de transmission dans le r6seau (2) du 
signal de parole re?u dans le terminal 1. Le mode devaluation du d6lai D2 
selon ('invention sera d6taiII6 plus loin en liaison avec la figure 3. 

Le terminal 1 comprend d'autre part un module 119 devaluation de d6lai 
M D1 M de traitement introduit lors de remission par le terminal 6metteur du signal 

10 de parole regu dans le terminal 1. En pratique, le d6lai D1 correspond au temps 
de codage, dans le terminal 6metteur, du signal de parole. Le mode 
devaluation du d6lai D1 selon invention sera 6galement d6tail!6 plus loin en 
liaison avec la figure 3. 

Les d&lais pr6cit6s D1, D2, D3 6valu§s selon ('invention sont fournis au 

15 module 133 devaluation du d£lai de transmission de bout en bout du signal de 
parole re?u dans le terminal 1. Selon Pinvention, le d£lai de bout en bout, "Dbb", 
est calculS par le module 133 & partir du d£lai D1 de traitement d lemission, du 
d6lai D2 de transmission, et du d6Iai D3 de traitement £ la reception. Le calcul 
du d£lai Dbb sera detaiie plus bas en liaison avec la figure 3. 

20 Enfin, le terminal 1 selon Pinvention, comprend un module 135 de 

g6n6ration et de transmission ^informations de d6lai. Le module 135 r£cup£re 
chacune des valeurs de d6lai de bout en bout obtenues par le module 133, et 
g6n§re des informations representatives des valeurs de d£lai de bout en bout 
obtenues. Ces informations sont regroup6es par exemple sous la forme de 

25 "tickets de qualite de transmission" correspondant chacun & une ou plusieurs 
communications vocales etablies dans le terminal de communication 1 
consid6r6. 

Ces tickets de quality de transmission sont alors transmis & un serveur 
(4) de collecte sur le r£seau, destine & assurer la gestion des informations de 
30 d6lai de bout en bout envoy£es par un ensemble de terminaux de 
communication relics au r£seau. 
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La transmission des tickets de qualite sur le reseau s'effectue au travers 
du gestionnaire de protocotes 103 et de I'interface reseau 101. Selon un mode 
de realisation prefere, chaque ticket de qualite est incorpore dans un message 
transmis selon le protocole TCP au travers du reseau IP 2. 
5 Le serveur de collecte 4 est destine a assurer le traitement des tickets de 

qualite envoyes par un ensemble (1, 3) de terminaux de communication relies 
au reseau, afin d'evaluer la qualite de transmission des signaux de parole regus 
dans I'ensemble de ces terminaux. Le serveur de collecte recoit ainsi de la part 
de i'ensemble des terminaux de communication equipgs d'un dispositif selon 

10 invention, pour chaque terminal, periodiquement ou apres chaque 
communication vocale, les tickets de qualite generes. 

Selon un exemple ^implementation, a partir des tickets regus le serveur 
de collecte genere, dans un rapport de mesure de qualite de transmission, une - 
ligne de texte pour chaque ticket recu. Ce rapport est stocke en memoire dans 

15 le serveur. Les informations consignees dans ce rapport de qualite sont ensuite 
visualisables au travers d'une interface homme-machine (IHM) adaptee, par un 
operateur humain. Cette interface homme-machine peut etre par exemple une 
interface graphique affichee sur un ecran d'ordinateur. Ces informations 
visualisees pourront alors etre utilisees pour superviser la qualite de service 

20 relative & la voix sur IP, offerte sur le reseau. 

En relation avec la figure 3, on va a present decrire le precede, selon 
I'invention, devaluation du delai de transmission de bout en bout d'un signal de 
parole, ce precede incluant le precede selon I'invention devaluation du delai de 
traitement d'un signal de parole recu dans un terminal de communication. 

25 A la figure 3, a I'etape E30, les paquets de donnees (paquets UDP) 

contenant le signal de parole est foumi par la pile protocolaire 103 au filtre 
reseau 105. Ce dernier met en ceuvre un temporisateur (timer en anglais) 
determinant les instants requis pour evaluer le delai de transmission de bout en 
bout. 

30 Le temporisateur precite a done pour objectif de cadencer les evaluations 

du delai. Selon un exemple d'imptementation, la cadence devaluation est fixee 
a une evaluation toutes les 15 secondes. Selon un autre exemple de 
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realisation, revaluation peut dtre effectu6e sous la forme d'une "rafale" de 
mesures, de mantere & obtenir une valeur moyenne, £ un instant donn6 f de ces 
mesures de d6lai. 

Lorsqu'une Evaluation du deiai doit avoir lieu (E31, oui), & P6tape E32, le 
5 filtre r6seau 105 extrait du flux UDP, les paquets RTP contenant les trames de 
parole, et recopie ce flux de paquets. 

A retape E34, le flux de paquets RTP dup!iqu6 par le filtre r6seau est 
fourni au module 123 de d6codage temoin qui reconstitue un signal de parole d 
partir de ces paquets audio. Le signal de parole reconstitue est ensuite 
10 sauvegarde dans le fichier F1 . 

En paralieie, a retape E36, le filtre audio 111 duplique le signal de parole 
reconstitue par le module 107 de t6l6phonie, et le sauvegarde dans le fichier 
F2. 

L'enregistrement du signal audio issu du decodeur temoin (123) et du 
15 signal audio issu du filtre audio (111) dans respectivement le fichier F1 et le 
fichier F2 est effectue de preference au mSme instant. 

On notera ici que, pour simplifier I'expose, les signaux audio pr6cites 
sont d6sign6s par les noms des fichiers qui les contiennent, c'est-S-dire F1 et 
F2. 

20 Dans le mode de realisation dealt ici, Pextraction des donnees audio 

effectuee par le filtre r£seau et le filtre audio est arretee au bout d'une duree 
predetermines, egale £ 5 secondes selon une implementation choisie. 

A retape E38, le module 131 devaluation du deiai de traitement "D3" 
applique un processus de mesure du taux d'activite vocale dans les signaux de 

25 parole F1 et F2, puis compare le taux mesure & un seuil predetermine. En 
pratique, ce seuil du taux d'activite vocale est fixe 3 30%. A retape E39, on 
determine le d6calage entre les deux signaux de parole F1 et F2 seulement si 
le taux d'activite vocale mesure dans les deux signaux F1 et F2, est sup6rieur 
au seuil predetermine. 

30 Par consequent, dans Pexemple ^implementation decrit ici, on determine 

(E39) le d6calage entre les deux signaux de parole F1 et F2 preiev6s, chacun 
de duree egale & 5 secondes, si le taux de parole dans ces signaux est 
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sup6rieur & 30 % (E38, oui). Dans le cas contraire (E38, non), on retoume & 
retape E31. Ce critdre d'activite vocale permet de verifier que les deux signaux 
contiennent suffisamment de parole pour rendre possible une mesure de 
d6calage temporel entre ces deux signaux. 

5 A retape E39, le module 131 devaluation de d6lai, effectue le calcul du 

d6calage temporel existant entre les deux signaux de parole F1 et F2. 

Selon un mode de realisation prefers, le decalage temporel entre les 
signaux F1 et F2 est mesure selon un proc6d6 utilisant une fonction 
d'intercorreiation des signaux d'enveloppe du signal F1 et du signal F2. 

10 Pour mesurer le decalage temporel entre les signaux F1 et F2, on pourra 

utiliser par exemple la methode decrite dans le brevet fran$ais publie sous le n° 
2 733 867 intitule "Proc6d6 et dispositif de mesure sans intrusion de fa quality 
de transmission d'une ligne t6!6phonique". La methode d6crite dans ce 
document y est expos6e en particulier en reference d la figure 1a, et appliqu6e 

15 & un signal de parole et au signal d'6cho correspondant. Dans le cadre de la 
presente invention, la methode de mesure decrite dans le document precite, est 
appliquee aux signaux de parole F1 et F2. 

Ainsi en reprenant la methode decrite dans le document precite, les 
echantillons du signal de parole F1 issu du decodeur temoin sont ftltres au 

20 moyen d'un filtre passe-bas sur une duree determin6e et les echantillons du 
signal F2 issu du filtre audio sont egalement filtres sur une duree sensiblement 
egale d la moitie de cette duree determinee mais decaiee de la moitie de celle- 
ci, ce qui permet d'obtenir des signaux d'enveloppe du signal F1 et du signal 
F2. Une plurality de coefficients d'intercorreiation entre les signaux F1 et F2, 

25 pour des retards successifs distincts de pas de retard determine, est etablie. 
Une comparaison des coefficients d'intercorreiation permet de discriminer le 
coefficient d'intercorreiation de valeur la plus grande, pour une valeur de retard 
sp6cifique, cette valeur de retard sp6cifique etant representative de la mesure 
du d6calage temporel, note "Dt", entre le signal F1 et le signal F2. 

30 A retape E40, le deiai D3 representatif du temps de traitement du signal 

de parole re9u dans le terminal de communication (1) consider, est obtenu en 
effectuant la somme du decalage temporel "Dt" mesure entre les signaux de 
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parole F1 et F2, et du temps de decodage predetermine, 'Tdec", du decodeur 
temoin (123), c'est-a-dire : D3 ■ Dt + Tdec . 

Conformement a I'invention, la mesure du delai D3 du temps de 
traitement du signal de parole recu dans le terminal est effectuee dans le cadre 
5 de revaluation du delai de transmission de bout en bout du signal de parole. 

A cet effet, comme represents a la figure 3, au cours des etapes E41 et 
E42, on evalue (E41) le delai "D1" de traitement a remission du signal de 
parole, et on mesure (E42) le delai "D2" de transmission du signal de parole 
dans le rSseau. 

10 Selon ('implementation decrite ici, le delai "D1" de traitement a remission 

du signal de parole est evalue par consultation d'une table stockee en memoire 
dans le terminal recepteur. Dans cette table sont enregistrees, par type de 
codeur a remission du signal de parole recu, une valeur maximale et une valeur 
minimale predefines du delai "D1", ces valeurs predefines prenant en compte 

15 la charge utile (payload) des paquets IP recus. 

Le type de codeur a remission et la charge utile des paquets IP recus, 
sont identifies dans le terminal rScepteur a partir de messages de signalisation 
d'appel contenus dans les paquets IP recus. Dans le mode de realisation decrit, 
les messages de signalisation sont des messages selon le protocole de 

20 signalisation d'appel H.225.0. 

Le mode devaluation du delai "D1" expose ici, est decrit dans le 
document intitule "Estimating E-model Id within a VoIP network, Technical 
note", de la societe Psytechnics, que I'on peut trouver a I'adresse Internet 
suivante : ' http://www.psytechnics.com/papers/ld_Emodel_technote_1.lpdf'. 

25 La methode decrite est derivee de la recommandation G.114 de I'UIT-T : 

"SYSTEMES ET SUPPORTS DE TRANSMISSION, SYSTEMES ET RESEAUX NUMERIQUES - 

Temps de transmission dans un sens". 

On notera ici que le type de codeur a remission (codec negocie) peut 
egalement etre obtenu a partie des messages de negociation d'appel (H.245) 
30 extraits des paquets de donnSes recus dans le terminal. Ces messages de 
negotiations d'appels sont extraits par le filtre reseau (105), a partir desquels 
des informations d'identification de la communication vocale sont obtenues, en 
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particulier, les dates de debut et de fin de communication, le codec (codeur- 
decodeur audio) negocie entre le terminal appelant et le terminal appele, la 
charge utile (payload) des paquets IP recus, les identifiants, par exemple les 
adresses IP, des terminaux appelant et appele, le chemin reliant les deux 
5 terminaux au travers du reseau. 

La table ci-dessous foumit une liste de delais d'encodage (D1) "meilleur 
cas" et "pire cas" (en anglais best caseet worst case) pour trois des codecs 
VoIP les plus utilises. Cette table est extraite du document de Psytechnics 
precite. 



Codec 


D1, meilleur cas (ms) 


D1, pire cas (ms) 


G.711 


Taille_paquet 


Taille paquet + 0,125 


G.729 


Taille_paquet + 5 


Taille_paquet +5 + 10 


G.723.1 


Taille_paquet + 7,5 


2 * Taille_paquet + 7,5 + 30 



En pratique, dans la plupart des situations, le deiai (D1) d'encodage d 
remission sera plus proche de la situation "meilleur cas" et par consequent, une 
estimation raisonnable du deiai d'encodage D1 consiste & choisir la valeur 
15 minimale ("meilleur cas") augmentee de 20 %. 

Dans cette evaluation, le temps s'ecoulant entre le moment oCj un paquet 
est prfit a la transmission, dans le terminal emetteur, et le moment ou il apparaTt 
sur la ligne de transmission, est insignifiant et par consequent neglige. 

Ainsi, la connaissance du type de codec & remission et la charge utile 
20 des paquets IP, permet d'estimer le temps de codage (temps de traitement a 
remission) £ I'interieur d'une plage de delais. 

De retour d la figure 3, une fois le delai D1 d'encodage d remission 
calcuie, ce dernier est fourni au module (133) charge d'evaluer le deiai de bout 
en bout, comme repr6sent6 £ retape E43. 
25 A retape E42, le d6lai "D2" de transmission du signal de parole dans le 

reseau est evalu6. Selon un mode pr6fere de realisation de I'invention, ce deiai 
est 6value selon deux methodes alternatives. 
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La premiere consists & utiliser les paquets "sender report 9 (SR), en 
frangais "rapport d'emetteur", presents dans les paquets RTCP (contenus dans 
les frames UDP des paquets IP re$us). Le calcul du d6lai (D2) de transmission 
du terminal emetteur vers le terminal r6cepteur peut dtre facilement obtenu & 

5 partir des informations contenues dans les paquets SR. Pour obtenir plus de 
details sur le mode de calcul de ce d6lai £ partir des informations contenues 
dans les paquets SR, on pourra se reporter au document RFC1889 de TIETF 
{Internet Engineering Task Force), ce document etant disponible & I'adresse 
Internet suivante : 1 http://wwwjetf.org/rfc/rfc1889.txt \ On pourra y consulter 

10 notamment le point 6.3.2 associe £ la figure 2 de ce document, intitule 
"Example for round-trip time computation" (exemple de calcul de temps d'aller- 
retour). 

Lorsque les paquets SR ne sont pas disponibles au cours de la 
communication, soit que le terminal emetteur ou ('application de teiephonie du 

15 terminal emetteur neje permette pas, soit que la communication vocale est trop 
courte, ou pour toute autre raison provoquant Pabsence de rapports demission 
dans les paquets re$us, une methode alternative devaluation du deiai (D2) de 
transmission sur le r6seau est utilisee. 

Selon un mode de realisation pr6f6r6 de Pinvention, cette methode 

20 alternative consiste & utiliser le programme utilitaire connu sous le nom "Ping". 
L'utilitaire Ping utilise la fonction Echo du protocole ICMP (Internet Control 
Message Protocol) qui est d6taill6e dans le document RFC792 de PIETF et 
disponible a Padresse Internet suivante : 1 http://www.ietf.org/rfc/rfc792.txt \ 

Dans le cadre de la pr6sente invention, le terminal r6cepteur (1) envoie 

25 . un petit paquet au travers du r6seau vers Padresse IP du terminal emetteur (3). 
Le terminal r6cepteur (1) attend alors un paquet de retour (6cho) en 
provenance du terminal emetteur (3). Ensuite, en divisant par deux, le temps 
ecouie entre renvoi du paquet "Ping" et la reception du paquet "echo", on 
obtient une evaluation moyenne du temps de transmission (D2) sur le reseau 

30 entre le terminal 6metteur et le terminal r6cepteur. 



r 
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De m§me que pour le deiai D1 ( une fois le ddlai D2 de transmission sur 
le r6seau, calcuie, ce dernier est fourni au module (133) charge d'6valuer le 
d6lai de bout en bout £ retape E43. 

A l'6tape E43, le d6lai de transmission de bout en bout "Dbb" est calculi 
5 d partir du deiai "D1" de traitement (encodage) & Emission, du deiai "D2" de 
transmission dans le r6seau f et du d6lai "D3" de traitement & la reception. En 
pratique, le deiai de bout en bout est obtenu par sommation des valeurs 
calcuiees des deiais D1, D2, D3. 

Enfin, £ l'6tape E44 v la valeur de d6lat de bout en bout calcuiee est 
10 m6moris6e pour etre 6ventuellement transmise & un serveur de collecte sur le 
reseau, comme expose supra en liaison avec la figure 2. Si c'est le cas, les 
etapes suivantes (non representees sur la figure 3) sont ex6cutees : 

- creation deformations representatives des valeurs de deiai de bout en 
bout obtenues ; 

15 - transmission des informations de deiai de bout en bout d un serveur de 

collecte sur le reseau, le serveur etant destine d assurer la gestion des 
informations de deiai de bout en bout envoy6es par un ensemble de terminaux 
de communication relies au reseau. 

En resume, la pr6sente invention concerne notamment un procede 

20 devaluation du deiai de traitement d'un signal de parole contenu dans des 
paquets de donn6es regus dans un terminal r6cepteur 6quipe d'un module de 
teiephonie, au cours d'une communication vocale etablie au travers d'un reseau 
£ commutation de paquets avec un terminal emetteur des paquets de donn6es. 
^invention concerne aussi un proc6d6 devaluation du deiai de transmission de 

25 bout en bout d'un signal de parole regu dans un terminal r6cepteur, ce deiai de 
bout en bout incluant le deiai pr6cit6 de traitement du signal de parole. 

Dans le mode de realisation decrit plus haut, les etapes de ces procedes 
sont determinees par les instructions de programmes d'ordinateur, et sont 
mises en oeuvre lorsque ces programmes sont charges dans un ordinateur ou 

30 plus gen6ralement un systeme informatique, dont le fonctionnement est alors 
commande par l'ex6cution de ces programmes. 
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En consequence, I'invention s'applique egalement a des programmes 
d'ordinateur, particulierement des programmes d'ordinateur sur ou dans un 
support d'informations, adaptes a mettre en oeuvre I'invention. Ces programmes 
peuvent utiliser n'importe quel langage de programmation, et etre sous la forme 
5 de code source, code objet ou de code intermediate entre code source et code 
objet, tel que dans une forme partieilement compilee, ou dans n'importe quelle 
autre forme souhaitable pour implementer un procede selon I'invention. 

Le support d'informations peut etre n'importe quelle entite ou dispositif 
capable de stocker le programme. Par exemple, le support peut comporter un 

10 mqyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM 
semi-conducteur, ou un moyen d'enregistrement magnetique, par exemple une 
disquette (floppy disc) ou un disque dur. D'autre part, un tel support peut etre 
un support transmissible tel qu'un signal electrique ou optique, qui peut 6tre 
achemine via un cable electrique ou optique, ou encore par radio ou par 

15 d'autres moyens. En particulier un programme selon I'invention peut etre 
telecharge via I'lnternet. 

Alternativement, le support d'informations peut 6tre un circuit integre 
dans lequel le programme est incorpore, le circuit etant adapts pour executer 
ou pour etre utilise dans I'execution du procede en question. 

20 L'invention concerne aussi un equipement terminal de communication 

vocale equipe d'un dispositif selon I'invention, tel qu'un telephone IP ou un PC 
multimedia equipe d'un logiciel de telephonie. L'invention concerne plus 
generalement tout equipement de terminaison IP equipe d'un dispositif 
devaluation de d£lai selon l'invention. 

25 Bien entendu, la presente invention n'est nullement limitee aux modes de 

realisation decrits et represents ici, mais englobe, bien au contraire, toute 
variante a la portee de I'homme du metier. 



WO 2005/015889 



25 



PCT/FR2004/001636 



RE^/ENDICATPN? 

1. Proc6d6 devaluation du deiai de traitement d'un signal de parole 
5 contenu dans des paquets de donn6es re$us dans un terminal r6cepteur 6quip6 

d'un module de teiephonie, au cours d'une communication vocale etablie au 
travers d'un r6seau d commutation de paquets avec un terminal emetteur 
desdits paquets de donn6es, ledit procede etant caracteris6 en ce qu'il 
comporte les etapes suivantes : 
10 -obtention (E32), d partir des paquets de donnSes re$us, d'un flux de 

paquets audio contenant le signal de parole ; 

- d6codage (E43), selon un temps de d6codage predetermine, du flux de 
paquets audio obtenu et creation d'un premier signal de parole (F1) 
reconstitu6 ; 

15 - duplication (E36) d'au moins une partie du signal de parole reconstitu6 

par ie module de teiephonie, ladite partie du signal de parole reconstitue 
constituant un second signal de parole (F2) ; 

- determination (E39) du decalage temporel existant entre les premier 
(F1) et second (F2) signaux de parole ; 

20 - calcul (E40) du d£lai "D3" de traitement du signal de parole dans le 

terminal r§cepteur, & partir d ( au moins le d6calage temporel mesur6 entre 
lesdits premier (F1) et second (F2) signaux de parole, et le temps de d§codage 
predetermine. 

2. Procede selon la revendication 1, caracterise en ce que le 
25 decalage temporel existant entre le premier (F1) et le second (F2) signal de 

parole est mesure selon une methode utilisant une fonction d'intercorreiation 
des signaux d'enveloppe desdits premier et second signaux. 

3. Procede selon la revendication 1 ou 2, caract6ris6 en ce que 
retape (E39) de determination du decalage temporel est precedee d'une etape 

30 de detection (E38) d'activite vocale dans les premier et second signaux vocaux. 
les etapes qui suivent etant mises en oeuvre si Tactivite vocale detectee dans 
les premier et second signaux est superieure & un seuil predetermine. 
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4. Procede seton I'une quelconque des revendicatlons precedentes, 
caracterise en ce que I'etape (E34) de decodage selon un temps de decodage 
predetermine met en oeuvre un algorithme de decodage identique a celui mis 
en oeuvre dans ledit module de teiephonie ou dont la difference de temps de 

5 decodage est constante et connue par rapport a I'algorithme mis en oeuvre 
dans le module de teiephonie. 

5. Procede selon I'une quelconque des revendications precedentes, 
caracterise en ce que le temps de traitement "D3" est obtenue (E40) par 
sommation du decalage temporel determine entre les premier et second 

10 signaux de parole et du temps de decodage predetermine du premier signal de 
parole. 

6. Procede selon I'une quelconque des revendications precedentes, 
caracterise en ce que ledit reseau a commutations de paquets est un reseau 
base sur le protocole IP, les paquets de donnees recus dans le terminal etant 

15 des paquets IP. 

7. Procede devaluation du delai de transmission de bout en bout 
d'un signal de parole recu dans un terminal recepteur, au cours d'une 
communication vocale etablie au travers d'un reseau a commutation de paquets 
avec un terminal emetteur dudit signal de parole, caracterise en ce qu'il 

20 comporte une etape devaluation du delai "D3" de traitement du signal de parole 
dans le terminal recepteur, selon un procede conforme a I'une quelconque des 
revendications 1 a 6. 

8. Procede selon la revendication 7, caracterise en ce qu'il comporte 
en outre les etapes suivantes : 

25 - evaluation (E41) du delai "D1" de traitement a remission du signal de 

parole ; 

- mesure (E42) du delai "D2" de transmission du signal de parole dans le 
reseau ; 

- evaluation (E43) du delai de transmission de bout en bout a partir dudit 
30 delai "D1" de traitement a remission, dudit delai "D2" de transmission, et dudit 

delai "D3" de traitement a la reception. 
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9. Proced6 selon la revendication 8, caracterise en ce que le delai 
"D1" de traitement a remission du signal de parole est evalue (E41) par 
consultation d'une table stockee dans le terminal recepteur dans laquelle sont 
enregistrees, par type de codeur a remission du signal de parole, une valeur 

5 maximale et une valeur minimale predefines dudit delai "D1", lesdites valeurs 
predefines prenant en compte la charge utile des paquets IP recus. 

10. Precede selon la revendication 8 ou 9, caracterise en ce que le 
delai "D2" de transmission du signal de parole dans le reseau est evalue (E42) 
selon une technique de type Ping. 

10 11. Precede selon la revendication 8 ou 9, caracterise en ce que le 

delai "D2" de transmission du signal de parole dans le reseau est evalue a 
partir d'informations de type Sender Report extraites des paquets recus. 

12. Precede selon I'une quelconque des revendications 7 a 11, 
caracterise en ce que le delai de transmission de bout en bout a partir est 

15 evalue (E43) par sommation dudit delai "D1" de traitement a remission, dudit 
delai "D2" de transmission, et dudit delai "D3" de traitement a la reception. 

13. Precede selon I'une quelconque des revendications 7 a 12, 
caracterise en ce qu'il comporte en outre les etapes de : 

- creation d'informations representatives des valeurs de delai de bout en 
20 bout obtenues ; 

- transmission desdites informations de delai de bout en bout a un 
serveur de collecte sur le reseau, ledit serveur etant destin6 a assurer la 
gestion des informations de delai de bout en bout envoyees par un ensemble 
de terminaux de communication relies au reseau. 

25 14. Dispositif devaluation du delai de traitement d'un signal de parole, 

a installer dans un terminal recepteur equipe d'un module de telephonie, pour 
evaluer ledit delai de traitement a partir de paquets de donnees regus dans le 
terminal recepteur au cours d'une communication vocale etablie au travers d'un 
reseau a commutation de paquets avec un terminal emetteur desdits paquets 

30 de donnees, ledit dispositif etant caracterise en ce qu'il co mporte : 

- un module (105) de filtrage reseau apte a obtenir, a partir des paquets 
de donnees recus, un flux de paquets audio contenant le signal de parole ; 
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- un module (123) de decodage dlt "temoin" ayant un temps de decodage 
predetermine, pour decoder le flux de paquets audio obtenu et cr6er un premier 
signal de parole (F1) reconstitue ; 

- un module (111) de filtrage audio destine a dupllquer au moins une 
5 partie du signal de parole reconstitue par le module de telephonie, ladite parte 

du signal de parole reconstitue constituant un second signal de parole (F2); 

- des moyens (131) pour determiner le decalage temporel existant entre 
les premier (F1) et second (F2) signaux de parole ; 

- des moyens (131) pour calculer le delai "D3" de traitement du signal de 
10 parole dans le terminal recepteur, a partir d'au moins le decalage temporel 

mesure entre lesdits premier (F1) et second (F2) signaux de parole, et le temps 
de decodage predetermine. 

15. Dispositif selon la revendication 14, caracterise en ce qu'il 
comporte en outre des moyens pour mettre en oeuvre un procede devaluation 

15 du delai de traitement d'un signal de parole, tel que revendique dans I'une 
quelconque des revendications 2 a 6. 

16. Dispositif devaluation du delai de transmission de bout en bout 
d'un signal de parole, a installer dans un terminal recepteur equipe d'un module 
de telephonie, pour evaluer iedit delai de transmission a partir de paquets de 

20 donnees recus dans le terminal recepteur au cours d'une communication vocale 
etablie au travers d'un r6seau a commutation de paquets avec un terminal 
6metteur desdits paquets de donn6es, Iedit dispositif etant caracterise en ce 
qu'il comprend des moyens pour mettre en oeuvre un proc6d6 devaluation du 
d6lai de transmission de bout en bout tel que revendique dans I'une quelconque 

25 des revendications 7 a 13. 

17. Equipement terminal de telephonie sur r6seau a commutation de 
paquets, notamment un telephone IP ou un ordinateur personnel dote d'un 
logiciel de telephonie, caracterise en ce qu'il inclut un dispositif devaluation du 
d6lai de traitement d'un signal de parole tel que revendique dans la 

30 revendication 14 ou 15. 

18. Equipement terminal de telephonie sur reseau a commutation de 
paquets, notamment un telephone IP ou un ordinateur personnel dote d'un 
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loglciel de telephone, caracterise en ce qu'il inclut un dispositif devaluation du 
delal de transmission de bout en bout d'un signal de parole tel que revendique 
dans la revendication 16. 

1 9. Programme d'ordinateur sur un support d'informations, comportant 
5 des instructions de programme adaptees a la mise en ceuvre d'un procede 

selon Tune quelconque des revendications 1 a 6, lorsque ledit programme est 
charge et execute dans un systeme informatique. 

20. Programme d'ordinateur sur un support d'informations, comportant 
des instructions de programme adaptees a la mise en ceuvre d'un procede 

10 selon I'une quelconque des revendications 7 a 13, lorsque ledit programme est 
charge et execute dans un systeme informatique. 
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